Definition Was ist DeepSeek?

Von Holger Hagedorn 2 min Lesedauer

Anbieter zum Thema

DeepSeek Ltd. ist ein KI-Startup aus China. Es wurde am 17. Juli 2023 in Hangzhou, Zhejiang, gegründet. Zu den Tätigkeitsschwerpunkten des Unternehmens gehört die Entwicklung von Systemen auf dem Gebiet der Natürlichen Sprachverarbeitung (NLP).

Das aktuelle Hauptmodell DeepSeek-R1 verwendet eine Mixture-of-Experts-Architektur mit 671 Milliarden Parametern und kann mit Kontextfenstern von bis zu 128.000 Tokens arbeiten.(Bild:  kebox - stock.adobe.com)
Das aktuelle Hauptmodell DeepSeek-R1 verwendet eine Mixture-of-Experts-Architektur mit 671 Milliarden Parametern und kann mit Kontextfenstern von bis zu 128.000 Tokens arbeiten.
(Bild: kebox - stock.adobe.com)

Hinter DeepSeek steht der ebenfalls in Hangzhou ansässige Hedgefonds High-Flyer. Seine Ursprünge gehen auf die Finanzkrise der Jahre 2007 - 2008 zurück. In dieser Zeit begannen drei Studenten der Zhejiang-Universität, darunter der angehende KI-Experte Liang Wenfeng, im Aktienhandel tätig zu werden. Im Februar 2016 gründeten sie schließlich das Unternehmen High-Flyer, das ab 2019 zum Hedgefond wurde. In der Folge konnte sich High-Flyer erfolgreich auf dem Gebiet des KI-basierten Hochfrequenzhandels durchsetzen.

Ab 2021 begann Liang Wenfeng mit den Vorbereitungen für ein KI-Projekt, indem er mehrere Tausend Nvidia-GPUs kaufte, die zu dieser Zeit noch nach China geliefert werden durften. Daraus sollte ein Labor für künstliche allgemeine Intelligenz (AGI) entstehen. Am 17. Juli 2023 wurde dann, finanziert von High-Flyer und unter der Leitung von Liang Wenfeng das Unternehmen DeepSeek gegründet. Als zentraler Punkt in der Philosophie von DeepSeek gilt seither, alle Entwicklungen des Unternehmens mit einer Open-Source-Lizenz auszustatten.

Das Large Language Model (LLM) DeepSeek R1

International bekannt wurde DeepSeek ab dem 20. Januar 2025 durch das Large Language Model (LLM) R1. Seine Leistungsfähigkeit soll mit der anderer KI-Systeme wie ChatGPT von OpenAI oder Claude von Anthropic vergleichbar sein. Allerdings benötige R1 nach Firmenaussagen für das Training sowie den Betrieb nur einen Bruchteil an Ressourcen. Vermutungen gehen indes dahin, dass zum Training des Modells R1: auf destillierte Daten aus bereits fertigen Modellen zurückgegriffen wurde, statt der angegebenen 2048 H800-Nvidia-Chips eher etwa 10.000 H800-Chips und weitere 10.000 H100-Chips verwendet wurden.

Zu den Besonderheiten am Modell R1 zählt, dass es nicht nach dem Prinzip des Supervised Fine-Tuning (SFT) vorgeht, sondern auf dem Reinforcement Learning (RL) beruht. Dazu kommt, dass R1 den Anwender im Unterschied zu anderen Chatbots an seinen "Gedankengängen" teilhaben lässt.

Kontroversen zu DeepSeek R1

Kritisch anzumerken ist ferner, dass das Modell R1 bestimmte Fragen beispielsweise nach dem Status von Taiwan, dem Massaker von Tian'anmen-Massaker oder dem Künstler Ai Weiwei entweder gar nicht oder im Sinne der chinesischen Regierungslinie beantwortet. Zudem gibt es Befürchtungen, dass der chinesische Staat Zugriff auf die von DeepSeek R1 gesammelten Daten hat.

Die Nutzung des Modells DeepSeek R1 ist daher aktuell (Stand: 07.02.2025) in den Regierungseinrichtungen mehrerer Länder verboten. Das trifft unter anderem auf Australien, Südkorea und die Niederlande zu.

(ID:50312581)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung